智能论文笔记

Concentration of polynomial random matrices via Efron-Stein inequalities

Goutham Rajendran , Madhur Tulsiani

分类：机器学习

2022-09-06

分析大型随机矩阵的浓度是多种领域的常见任务。给定独立的随机变量，许多工具可用于分析随机矩阵，其条目在变量中是线性的，例如基质 - 伯恩斯坦不平等。但是，在许多应用中，我们需要分析其条目是变量中多项式的随机矩阵。这些自然出现在光谱算法的分析中，例如霍普金斯等人。 [Stoc 2016]，Moitra-Wein [Stoc 2019]；并根据正方形层次结构的总和（例如Barak等。 [FOCS 2016]，Jones等。 [焦点2021]。在这项工作中，我们基于Paulin-Mackey-Tropp（概率Annals of Poylibity of Poyliby of 2016]，我们提出了一个通用框架来获得此类界限。 Efron-Stein不等式通过另一个简单（但仍然是随机）矩阵的范围来界定随机矩阵的规范，我们将其视为通过“区分”起始矩阵而引起的。通过递归区分，我们的框架减少了分析更简单的矩阵的主要任务。对于Rademacher变量，这些简单的矩阵实际上是确定性的，因此，分析它们要容易得多。对于一般的非拉多巴纳变量，任务减少到标量浓度，这要容易得多。此外，在多项式矩阵的设置中，我们的结果推广了Paulin-Mackey-Tropp的工作。使用我们的基本框架，我们在文献中恢复了简单的“张量网络”和“密集图矩阵”的已知界限。使用我们的一般框架，我们得出了“稀疏图矩阵”的边界，琼斯等人最近才获得。 [焦点2021]使用痕量功率方法的非平地应用，并且是其工作中的核心组成部分。我们希望我们的框架对涉及非线性随机矩阵浓度现象的其他应用有帮助。

translated by 谷歌翻译

SparseFusion: Distilling View-conditioned Diffusion for 3D Reconstruction

Zhizhuo Zhou , Shubham Tulsiani

分类：计算机视觉

2022-12-01

We propose SparseFusion, a sparse view 3D reconstruction approach that unifies recent advances in neural rendering and probabilistic image generation. Existing approaches typically build on neural rendering with re-projected features but fail to generate unseen regions or handle uncertainty under large viewpoint changes. Alternate methods treat this as a (probabilistic) 2D synthesis task, and while they can generate plausible 2D images, they do not infer a consistent underlying 3D. However, we find that this trade-off between 3D consistency and probabilistic image generation does not need to exist. In fact, we show that geometric consistency and generative inference can be complementary in a mode-seeking behavior. By distilling a 3D consistent scene representation from a view-conditioned latent diffusion model, we are able to recover a plausible 3D representation whose renderings are both accurate and realistic. We evaluate our approach across 51 categories in the CO3D dataset and show that it outperforms existing methods, in both distortion and perception metrics, for sparse-view novel view synthesis.

translated by 谷歌翻译

Teaching Autonomous Systems Hands-On: Leveraging Modular Small-Scale Hardware in the Robotics Classroom

Johannes Betz , Hongrui Zheng , Zirui Zang , Florian Sauerbeck , Krzysztof Walas , Velin Dimitrov , Madhur Behl , Rosa Zheng , Joydeep Biswas , Venkat Krovi

分类：机器人

2022-09-21

尽管机器人学课程在高等教育方面已建立，但这些课程通常专注于理论，有时缺乏对开发，部署和将软件应用于真实硬件的技术的系统覆盖。此外，大多数用于机器人教学的硬件平台是针对中学水平的年轻学生的低级玩具。为了解决这一差距，开发了一个自动驾驶汽车硬件平台，称为第1 f1 f1tth，用于教授自动驾驶系统。本文介绍了以“赛车”和替换考试的竞赛为主题的各种教育水平教学模块和软件堆栈。第1辆车提供了一个模块化硬件平台及其相关软件，用于教授自动驾驶算法的基础知识。从基本的反应方法到高级计划算法，教学模块通过使用第1辆车的自动驾驶来增强学生的计算思维。第1辆汽车填补了研究平台和低端玩具车之间的空白，并提供了学习自主系统中主题的动手经验。多年的四所大学为他们的学期本科和研究生课程采用了教学模块。学生反馈用于分析第1个平台的有效性。超过80％的学生强烈同意，硬件平台和模块大大激发了他们的学习，而超过70％的学生强烈同意，硬件增强了他们对学科的理解。调查结果表明，超过80％的学生强烈同意竞争激励他们参加课程。

translated by 谷歌翻译

RelPose: Predicting Probabilistic Relative Rotation for Single Objects in the Wild

Jason Y. Zhang , Deva Ramanan , Shubham Tulsiani

分类：计算机视觉 | 机器学习

2022-08-11

我们描述了一种数据驱动的方法，用于指定任意对象的多个图像，以推断相机观点。该任务是经典几何管道（例如SFM和SLAM）的核心组成部分，也是当代神经方法（例如NERF）的至关重要的预处理要求，以对象重建和视图合成。与现有的对应驱动的方法相反，鉴于稀疏视图的表现不佳，我们提出了一种基于自上而下的预测方法来估计相机观点。我们的主要技术见解是使用基于能量的公式来表示相对摄像机旋转的分布，从而使我们能够明确表示由对象对称或视图引起的多个摄像机模式。利用这些相对预测，我们共同估计了来自多个图像的一致摄像机旋转集。我们表明，我们的方法优于最先进的SFM和SLAM方法，并且在可见和看不见的类别上都稀疏图像。此外，我们的概率方法显着优于直接回归相对姿势的表现，这表明对多模型建模对于相干关节重建很重要。我们证明，我们的系统可以是从多视图数据集中进行野外重建的垫脚石。可以在https://jasonyzhang.com/relpose上找到带有代码和视频的项目页面。

translated by 谷歌翻译

This is the Way: Differential Bayesian Filtering for Agile Trajectory Synthesis

Trent Weiss , Madhur Behl

分类：机器人

2022-07-15

自主赛车的主要挑战之一是在复杂的赛车课程中设计用于运动计划的算法。先前已经提出了端到端轨迹合成，其中根据赛车的摄像头图像计算自我车辆的轨迹。这是在使用行为克隆技术的监督学习设置中完成的。在本文中，我们通过引入差异贝叶斯过滤（DBF）来解决轨迹合成行为克隆方法的局限性，该贝叶斯过滤（DBF）使用概率B \'ezier曲线作为推断基于贝叶斯推论的最佳自主赛车轨迹的基础。我们引入了轨迹采样机构，并将其与过滤过程相结合，该过程能够将汽车推向其物理驾驶极限。 DBF的性能在深度序列的一级模拟环境中进行了评估，并将其与其他几种轨迹合成方法以及人类驾驶性能进行了比较。 DBF通过将赛车推到其控制范围的同时，同时始终保持在轨道范围内，从而达到了最快的圈时间和最快的速度。

translated by 谷歌翻译

Which one is more toxic? Findings from Jigsaw Rate Severity of Toxic Comments

Millon Madhur Das , Punyajoy Saha , Mithun Das

分类：自然语言处理

2022-06-27

在线仇恨言论的扩散需要创建可以检测毒性的算法。过去的大多数研究都集中在这一发现作为分类任务上，但是分配绝对毒性标签通常很棘手。因此，过去很少有作品将相同的任务转变为回归。本文显示了拼图的最近发布的毒性严重性测量数据集上对不同变压器和传统机器学习模型的比较评估。我们进一步使用解释性分析来证明模型预测的问题。

translated by 谷歌翻译

Universal Early Warning Signals of Phase Transitions in Climate Systems

Daniel Dylewsky , Timothy M. Lenton , Marten Scheffer , Thomas M. Bury , Christopher G. Fletcher , Madhur Anand , Chris T. Bauch

分类：机器学习

2022-05-31

The potential for complex systems to exhibit tipping points in which an equilibrium state undergoes a sudden and often irreversible shift is well established, but prediction of these events using standard forecast modeling techniques is quite difficult. This has led to the development of an alternative suite of methods that seek to identify signatures of critical phenomena in data, which are expected to occur in advance of many classes of dynamical bifurcation. Crucially, the manifestations of these critical phenomena are generic across a variety of systems, meaning that data-intensive deep learning methods can be trained on (abundant) synthetic data and plausibly prove effective when transferred to (more limited) empirical data sets. This paper provides a proof of concept for this approach as applied to lattice phase transitions: a deep neural network trained exclusively on 2D Ising model phase transitions is tested on a number of real and simulated climate systems with considerable success. Its accuracy frequently surpasses that of conventional statistical indicators, with performance shown to be consistently improved by the inclusion of spatial indicators. Tools such as this may offer valuable insight into climate tipping events, as remote sensing measurements provide increasingly abundant data on complex geospatially-resolved Earth systems.

translated by 谷歌翻译

Adaptive Lookahead Pure-Pursuit for Autonomous Racing

Varundev Sukhil , Madhur Behl

分类：机器人

2021-11-17

本文介绍了一个自适应寻道纯追踪横向控制器，用于优化赛车度量，如圈时间，平均圈速度，以及从自主赛车场景中的参考轨迹的偏离。我们提出了一种贪婪的算法来计算和为每个航空点计算和分配用于改进种族度量的参考轨迹的纯Puppuit控制器的最佳保护距。我们使用基于ROS的自主赛车模拟器来评估自适应纯追踪算法，并将我们的方法与其他基于纯粹的横向控制器进行比较。我们还在使用F1 / 10自动raceCar上展示了我们在缩放实际测试的方法上。我们的方法导致自动racecar的赛车指标中的重大改善（20％）。

translated by 谷歌翻译

A Differentiable Recipe for Learning Visual Non-Prehensile Planar Manipulation

Bernardo Aceituno , Alberto Rodriguez , Shubham Tulsiani , Abhinav Gupta , Mustafa Mukadam

分类：机器人 | 人工智能

2021-11-09

使用视频指定任务是获取新颖和一般机器人技能的强大技术。然而，推理机械和灵巧的互动可以使其挑战规模学习接触的操纵。在这项工作中，我们专注于视觉非预先展示平面操作的问题：给定平面运动中对象的视频，找到再现相同对象运动的联系人感知机器人动作。我们提出了一种新颖的架构，可微分的操纵（\我们）的学习，它通过利用可微分优化和基于有限差分的模拟来将视频解码与接触机械的前沿的视频解码神经模型结合在一起。通过广泛的模拟实验，研究了基于模型的技术与现代深度学习方法之间的相互作用。我们发现，我们的模块化和完全可差的架构比看不见的对象和运动的学习方法更好。 \ url {https://github.com/baceituno/dlm}。

translated by 谷歌翻译

VizAI : Selecting Accurate Visualizations of Numerical Data

Ritvik Vij , Rohit Raj , Madhur Singhal , Manish Tanwar , Srikanta Bedathur

分类：人工智能 | 机器学习

2021-11-07

良好的数据可视化不仅是无失真的数据图形表示，而且是一种揭示数据统计特性的方法。尽管在数据分析的各个阶段常用，但选择良好的可视化通常是涉及许多迭代的手动过程。最近，兴趣通过开发可以推荐可视化的模型来减少这项努力，但它们的使用量有限，因为它们需要大型培训样本（数据和可视化对）并主要关注设计方面，而不是评估效果选择可视化。在本文中，我们呈现Vizai，一种生成鉴别框架，首先从数据的多个替代可视化生成数据的各种统计特性。它链接到一个辨别模型，该模型选择最佳匹配被可视化数据的真实统计数据。 Vizai可以很容易地培训，可轻松监督，并适应具有不同程度的监督的设置。我们展示了Vizai的众所可求的判断和大型公开可视化的储存库，优于学习推荐可视化的现有方法的状态。

translated by 谷歌翻译